Statistik sebagai Pemetaan
Statistik secara formal didefinisikan sebagai fungsi $h: \mathbb{R}^n \to \mathbb{R}$. Kita mendefinisikan probabilitas statistik yang jatuh ke dalam himpunan $B$ menggunakan prapeta:
$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$
Dasar I.I.D.
Untuk sampel dari variabel acak i.i.d. (independen dan berdistribusi identik), probabilitas gabungan dari suatu titik sampel tertentu $(x_1, \dots, x_n)$ adalah hasil kali dari probabilitas marginal mereka: $p(x_1)p(x_2)\dots p(x_n)$. Produk ini berfungsi sebagai bobot untuk setiap titik saat menghitung probabilitas total bahwa statistik mengambil nilai tertentu.
Pertimbangkan populasi diskret di mana $p_X(1) = 1/2$, $p_X(2) = 1/4$, dan $p_X(3) = 1/4$. Kita mengambil sampel berukuran $n=2$ ($X_1, X_2$) dan mendefinisikan statistik kita sebagai rata-rata geometrik: $Y_2 = (X_1 X_2)^{1/2}$.
Untuk mencari distribusi $Y_2$, kita daftarkan semua pasangan $(X_1, X_2)$ yang mungkin sebanyak 9, hitung probabilitas gabungannya, dan nilai $Y_2$ yang dihasilkan:
| Pasangan $(x_1, x_2)$ | Prob $P(x_1)P(x_2)$ | $Y = \sqrt{x_1 x_2}$ |
|---|---|---|
| (1, 1) | 1/4 | 1.000 |
| (1, 2), (2, 1) | 1/8 + 1/8 = 1/4 | 1.414 |
| (1, 3), (3, 1) | 1/8 + 1/8 = 1/4 | 1.732 |
| (2, 2) | 1/16 | 2.000 |
| (2, 3), (3, 2) | 1/16 + 1/16 = 1/8 | 2.449 |
| (3, 3) | 1/16 | 3.000 |
Distribusi Eksak vs. Asimtotik
Sebelum beralih ke teorema batas seperti Teorema Batas Pusat (CLT), kita harus menguasai "Distribusi Eksak." Ini melibatkan perhitungan fungsi massa atau densitas probabilitas spesifik untuk suatu statistik dengan ukuran sampel $n$ yang kecil dan terbatas. Ketika bentuk analitik menjadi tidak dapat ditangani, kita beralih ke simulasi numerik seperti **pendekatan Monte Carlo**.